課程資訊
課程名稱
資料科學中的統計推論
Statistical Inference in Data Science 
開課學期
110-1 
授課對象
公共衛生學院  公共衛生學系  
授課教師
王彥雯 
課號
PH0015 
課程識別碼
801 00140 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期二7,8,9(14:20~17:20) 
上課地點
公衛211 
備註
公衛系生物統計與健康資訊模組必修。與蕭朱杏合授
限本系所學生(含輔系、雙修生)
總人數上限:30人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1101PH0015 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程將針對在資料科學時代,統計方法的理論背景與架構進行介紹,讓學生了解統計推論是如何進行的,內容將涵蓋機率、隨機變數、分配、估計、檢定等內容之基礎理論。有別於以往類似課程以數學推理證明為主,本課程將利用電腦軟體進行數據模擬實驗,以實際操作方式讓學生體會統計推論背後的理論架構。 

課程目標
了解統計推論的原理。 
課程要求
修課同學須具備微積分與基礎統計學的相關知識。 
預期每週課後學習時數
 
Office Hours
每週一 11:00~12:00 備註: 需要office hour的同學,可以在這個時段與助教約。 
指定閱讀
Rice, J. A. (2007). Mathematical Statistics and Data Analysis, 3rd edition. Cengage Learning. 
參考書目
1. Matloff, N. (2019). Probability and Statistics for Data Science: Math + R + Data, CRC.
2. Efron, B. and Hastie, T. (2016). Computer Age Statistical Inference: Algorithms, Evidence and Data Science. Cambridge.
 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
平時表現、課堂參與 
20% 
 
2. 
作業練習 
20% 
 
3. 
期中考 
30% 
 
4. 
期末考 
30% 
 
 
課程進度
週次
日期
單元主題
第1週
9/28  1. 課程介紹
2. 機率概念(王彥雯老師) 
第2週
10/05  1. 隨機變數:離散與連續隨機變數概念介紹
2. 分配:認識離散與連續機率分配(王彥雯老師) 
第3週
10/12  獨立隨機變數、條件機率分配、聯合機率分配(王彥雯老師) 
第4週
10/19  期望值I:期望值、變異數與標準差、共變異數與相關係數(王彥雯老師) 
第5週
10/26  期望值II:條件期望值與預測、動差生成函數、近似方法(王彥雯老師) 
第6週
11/02  極限定理:大數法則、分布收斂、中央極限定理(王彥雯老師) 
第7週
11/09  抽樣:母體與樣本、抽樣方法、估計(王彥雯老師) 
第8週
11/16  期中考(王彥雯老師) 
第9週
11/23  參數估計方法I:參數估計、動差估計法(蕭朱杏老師) 
第10週
11/30  參數估計方法I:最大概似估計法(蕭朱杏老師) 
第11週
12/07  參數估計方法II:貝氏估計法、有效性與Cramér-Roa lower bound、充分性
假設檢定與適合度評估:Neyman-Pearson paradigm、信賴區間與假設檢定、likelihood ratio檢定(蕭朱杏老師 
第12週
12/14  資料統整:統計圖、資料中心點的測量、資料離散程度的測量、與累積機率密度函數相關之方法(蕭朱杏老師) 
第13週
12/21  兩組樣本的比較:比較兩獨立樣本、比較相依樣本、實驗設計(蕭朱杏老師) 
第14週
12/28  變異數分析(蕭朱杏老師) 
第15週
1/04  類別資料分析:Fisher’s exact test、卡方檢定、配對資料分析、勝算比(蕭朱杏老師) 
第16週
1/11  期末考(蕭朱杏老師) 
第17週
1/18  教師彈性補充教學:專題演講